新书速递|王汉生:一本妙趣横生的、商业分析和数据科学入门级读物
The following article is from 人大社理工 Author 理工小编
时代在发展,科技在进步。我们已进入数字时代,数据也已渗透进我们日常生活的方方面面。
比如球迷都很关注的英超联赛,最佳射手是可以用技术回归的数据分析方法去计算出来的。
比如我们的国粹之一——麻将,最尴尬的莫过于三缺一的场面了,用深度学习的方法能让计算机学会打麻将,从此彻底告别尴尬。
再比如让亿万观众欲罢不能的《甄嬛传》,通过网络结构数据甚至可以分析出连甄学十级学者都忽略掉的剧中细节,用数据分析助力你登顶甄学学者之巅。
但要警惕的是,大数据也有可能穿着“皇帝的新装”,我们需要了解一些大数据方面的知识,以便能够看穿华丽的伪装与大数据骗局。
樊登读书会推荐
妙趣横生!!!
必备入门级读物
北大光华管理学院推荐用书
狗熊会出品
第一版销售6W册
数据思维:从数据分析到商业价值(第2版)
王汉生 等 著
ISBN:978-7-300-32267-4
出版时间:2024年1月
定价:139.00元(四色印刷)
01/
· 作者简介·
王汉生,北京大学光华管理学院商务统计与经济计量系教授、博士生导师。曾获国家杰出青年科学基金项目资助。教育部“长江学者”特聘教授,全国工业统计学教学研究会青年统计学家协会创始会长,美国数理统计学会(IMS)会员,美国统计协会(ASA)会员,国际统计学会(ISI)当选会员。历任9种国际学术期刊副主编。在国内外各种专业刊物上发表文章100余篇,与人合著英文专著1本,与人合著中文教材4本。爱思唯尔中国高被引学者(数学类,2014—2019年;应用经济学类,2020年;统计学类,2021—2022年)。主要研究领域为变量选择、数据降维、高维数据分析以及复杂网络数据分析,所有这些研究都以大规模、复杂、超高维数据分析为核心,其相关应用领域包括但不局限于中文文本、网络结构、位置轨迹。
曾担任博雅立方科技有限公司首席科学家(2009—2015年)、百分点首席统计学家(2015年至今)。此外,和量邦科技、考拉征信、彩虹无线、蓬景数字、西门子、三一重工、格灵深瞳、天罡仪表、广联达等众多企业有联合研究工作,涉及量化投资、互联网征信、车联网、移动设备广告实时竞价、搜索引擎营销、电子商务、重装制造业等多个重要行业。
02/
· 内容简介·
本书由微信公众号“狗熊会”(ID: CluBear)创始人王汉生教授(熊大)及其核心团队联合创作完成。本书可以被看作商业分析领域入门级通俗且有趣的读物,深入浅出,雅俗共赏,适合数据分析师、工程师、产品经理、销售人员、商务拓展人员以及数据企业高管阅读。
本书主要由六章组成。第一章介绍了熊大朴素的数据价值观,解读数据与价值的逻辑关系;第二章介绍了最基本的数据可视化方法(统计图表)的规范与有趣应用;第三章介绍了回归分析,通过精彩案例展示了如何将一个业务问题定义成一个数据可分析问题;第四章介绍了机器学习,可以看作对第三章技术上的一个重要补充;第五章展示了各种常见的非结构化数据(文本、图像)分析的有趣案例;第六章介绍了数据合规的相关内容。
03/
· 专家推荐·
这是一本非常有特点的数据科学入门读物。它的主要特点就是简单有趣。我很惊讶于作者能够用如此通俗易懂的语言,表达出数据科学中非常深刻的道理。作者将其称为“朴素的数据价值观”。整本书几乎没有任何数学公式,没有任何程序代码,但是数据科学的深刻道理被娓娓道来。通过本书,读者可以从风趣的语言文字中,感悟深刻的数据价值道理,见证中国数据产业的快速发展!
——范剑青(普林斯顿大学金融学讲座教授,复旦大学大数据学院创始院长)
这是一本极具特色、关于数据科学的雅俗共赏的读物。当其他数据科学书籍都在谈论算法模型的时候,这本书选择了研究数据、价值,以及从数据到价值的可实现路径,即“朴素的数据价值观”。在这个方法论的指引下,作者分享了一系列非常有趣的案例,横跨很多重要的新兴行业,例如车联网、消费金融等。每个案例都包含对数据业务的深刻理解、可落地的数据分析方法,以及最后产品化的形态。这是一条完整的从数据到价值的路径,显示的是绝大多数现有数据科学书籍所不具备的独特能力。
——姚琦伟(伦敦政治经济学院统计学讲座教授)
今天讲数据战略的不少,学数据技术的更多,而真正缺少的是一本通透的关于数据业务的指引。终于,“熊大”汉生教授以世界级的学术造诣、丰富的商务数据实战应用经验和生动酣畅的文笔,给我们带来了《数据思维》这一惊喜。数据思维是从数据到价值的产品思维,是打通数据技术与战略的业务思维,也是大数据创业、从业人士和产业管理者成功的必备思维。
——陈宇新(上海纽约大学全球杰出商学讲席教授)
04/
· 目录·
绪论 大数据时代之“皇帝的新装”
第一章 朴素的数据价值观
什么是数据?
数据的商业价值
数据到价值的转化:回归分析的道与术
弄清客户需求
关于p值的争论与思考
第二章 数据可视化
实力派:准确+有效
偶像派:简洁+美观
柱状图
堆积柱状图
柱状图之妙用
饼 图
直方图
折线图
散点图
箱线图
茎叶图
统计表
第三章 回归分析
什么是回归分析?
线性回归:北京市二手房房价影响因素分析
线性回归:电影票房影响因素分析
线性回归:数据分析岗位招聘情况解析
0-1回归:某移动通信公司客户流失预警分析
0-1回归:车险数据分析与商业价值
0-1回归:点击率预测在RTB广告投放中的应用
定序回归:信用卡逾期数据分析
计数回归:英超进球谁最强
生存回归:新产品在架时长研究
第四章 机器学习
朴素贝叶斯:政府热线电话
朴素贝叶斯:基于商品名称的多分类问题
决策树:什么因素决定非诚勿扰
决策树:二手车保值比率
回归树与提升算法:旅游产品销量影响因素
深度学习:图像自动识别
深度学习:LSTM模型自动作曲
深度学习:打麻将
聚类分析:狗熊牌皮鞋的广告投放
第五章 非结构化数据
文本分析:《琅琊榜》的小说三要素
文本分析:《倚天屠龙记》
文本分析:从用户评论看产品改善
文本分析:网易云音乐评论数据分析
网络结构数据:《甄嬛传》中的爱恨情仇
网络结构数据:统计期刊合作者社区发现
图像数据:通过图片识别PM2.5
第六章 数据合规
我国cookie隐私第一案
“被遗忘权”第一案
数据安全第一案